智能论文笔记

Explainable Natural Language Processing with Matrix Product States

Jirawat Tangpanitanon , Chanatip Mangkang , Pradeep Bhadola , Yuichiro Minato , Dimitris Angelakis , Thiparat Chotibut

分类：自然语言处理 | 机器学习

2021-12-16

尽管在自然语言处理（NLP）中经常发生的经常性神经网络（RNN），但由于RNN中的本质上复杂计算，RNN的理论理解仍然有限。我们在普遍存在的NLP任务中对RNNS的行为进行了系统分析，通过映射到一种称为经常性算术电路（RAC）和矩阵产品状态（MPS）之间的映射来对电影评论的情感分析。使用von-neumann纠缠熵（EE）作为信息传播的代理，我们表明单层RACS具有最大信息传播能力，由EE的饱和反映。放大超出EE饱和阈值的MP的键尺寸不会增加预测精度，因此可以构建最佳估计数据统计数据的最小模型。虽然饱和EE小于MPS的面积法可实现的最大EE，但我们的模型在现实情绪分析数据集中实现了〜99％的训练准确性。因此，单独的低EE不是针对NLP采用单层RAC的权证。与常见的信念相反，远程信息传播是RNNS表达的主要来源，我们表明单层RACS也从有意义的单词矢量嵌入中利用高表现力。我们的工作揭示了在RAC的现象学中，更一般地用于NLP的RNNS的解释性方面，使用来自许多身体量子物理学的工具。

translated by 谷歌翻译